AssignAdd
将输入张量的值累加到输出张量中,实现张量原地加法操作。
\[output_i = output_i + input_i\]
- 输入:
input - 输入数据地址。
output - 输出数据地址(同时作为输入和输出)。
length - 数组长度(元素个数)。
core_mask(int, 可选) - 核掩码(仅适用于共享存储版本)。
- 输出:
output - 原地写回累加结果。
- 支持平台:
FT78NEMT7004
备注
FT78NE 支持的数据类型:int8, int16, int32, fp32, fp64, cplx64, cplx128
MT7004 支持的数据类型:fp16, fp32, int16, int32, cplx64
共享存储版本:
-
void i8_assignadd_s(int8_t *input, int8_t *output, int length, int core_mask)
-
void i16_assignadd_s(int16_t *input, int16_t *output, int length, int core_mask)
-
void i32_assignadd_s(int32_t *input, int32_t *output, int length, int core_mask)
-
void fp_assignadd_s(float *input, float *output, int length, int core_mask)
-
void dp_assignadd_s(double *input, double *output, int length, int core_mask)
-
void c64_assignadd_s(float *input, float *output, int length, int core_mask)
-
void c128_assignadd_s(double *input, double *output, int length, int core_mask)
-
void hp_assignadd_s(half *input, half *output, int length, int core_mask)
C调用示例:
1// FT78NE 多核示例 2#include <stdio.h> 3#include <assignadd.h> 4 5int main(int argc, char* argv[]) { 6 float *input = (float *)0xA0000000; // input在DDR空间 7 float *output = (float *)0xB0000000; // output在DDR空间,同时作为输入和输出 8 int length = 1000; 9 int core_mask = 0xff; 10 11 // 执行 output[i] += input[i] 12 fp_assignadd_s(input, output, length, core_mask); 13 return 0; 14}
私有存储版本:
-
void i8_assignadd_p(int8_t *input, int8_t *output, int length)
-
void i16_assignadd_p(int16_t *input, int16_t *output, int length)
-
void i32_assignadd_p(int32_t *input, int32_t *output, int length)
-
void fp_assignadd_p(float *input, float *output, int length)
-
void dp_assignadd_p(double *input, double *output, int length)
-
void c64_assignadd_p(float *input, float *output, int length)
-
void c128_assignadd_p(double *input, double *output, int length)
-
void hp_assignadd_p(half *input, half *output, int length)
C调用示例:
1// MT7004 单核示例 2#include <stdio.h> 3#include <assignadd.h> 4 5int main(int argc, char* argv[]) { 6 half *input = (half *)0x10000000; // input在L2空间 7 half *output = (half *)0x10004000; // output在L2空间,同时作为输入和输出 8 int length = 1000; 9 10 // 执行 output[i] += input[i] 11 hp_assignadd_p(input, output, length); 12 return 0; 13}